从天龙八部小说衍生出的google语义分析与gephi社交网络
作者:zhaikun 风控建模屌丝一枚,现居于北京
个人微信公众号:Python数据分析与评分卡建模
联系方式:664086823@qq.com
数据和图获取方式:关注Python爱好者社区后回复 天龙八部
最近迷上了可视化,周末在家好好学了echarts与python+echarts的集合pyecharts,还有gephi。感兴趣的小伙伴可以看看。
忠告下,MAC下的gephi是大坑,windows下的pyecharts也稍微有点坑。
本文主要提供一个思路,把分析结果展示给大家,抛砖引玉。
================================分割线===============================
直接打开分过次的天龙八部(已上传)
jiabe tf_idf 分析,提取出最重要的100个词,这里只打印前10个词
萧峰和乔峰分别位于第2和第3呀,加起来第1哟,段誉当之无愧的第二,大家记好段誉这个名字,后面会对他进行相似度分析。至于虚竹是谁?虚竹?好像听过这个名字。。。
python一个好玩的包是词云,像不像大字报?上图
下面上google的word2vec
先分析阿朱、阿紫的相似度
再看与段誉最相似/相关的
出来了木婉清、王语嫣。嘿嘿,段誉别装了,就是木婉清了!
继续,老规矩的Python社交网络分析
上次很多小伙伴留言要我的社交网络画图法,这次我就一并放上吧,但是对于大数据下的社交网络,建议用gephi或别的可视化工具。
这个图是什么?看不懂!
下面上gephi图:
好吧,天龙八部大人可以好好分析了,主意,萧峰与乔峰有不同的社交网络哟!
数据和图获取方式:关注Python爱好者社区后回复 天龙八部
Python爱好者社区历史文章大合集:
Python爱好者社区历史文章列表(每周append更新一次)
关注后在公众号内回复“课程”即可获取:
0.小编的Python入门视频课程!!!
1.崔老师爬虫实战案例免费学习视频。
2.丘老师数据科学入门指导免费学习视频。
3.陈老师数据分析报告制作免费学习视频。
4.玩转大数据分析!Spark2.X+Python 精华实战课程免费学习视频。
5.丘老师Python网络爬虫实战免费学习视频。